Python调用百度AI，实现音频转换文字(标准版)

最新推荐文章于 2024-08-28 19:22:22 发布

异想实验室

最新推荐文章于 2024-08-28 19:22:22 发布

阅读量3.9k

点赞数 2

分类专栏： Python 百度AI ffmpeg 文章标签： python 百度人工智能

异想实验室

本文链接：https://blog.csdn.net/weixin_43775400/article/details/120964265

版权

本文介绍了如何使用Python配合百度AI服务将60秒以内的音频文件转换为文字。首先，文章提供了音频切割工具，如VAD和ffmpeg。接着，详细阐述了在Windows和Python3环境下创建百度AI应用并获取必要的认证参数。通过安装baidu-aip库，使用PCM格式的音频文件进行HTTP请求转换。此外，还提到了音频格式要求和可能出现的识别误差问题。

摘要由CSDN通过智能技术生成

写在前面：标准版最长支持60秒语音文件，大于60秒的音频文件，需要进行切割后，然后依次提交即可。

切割音频工具：
开源VAD音频切分工具

https://ai.baidu.com/ai-doc/SPEECH/xk38lxq46

ffmpeg模块

以下所有的操作均是在windows系统，Python3下实现的；

百度短语音识别介绍：https://ai.baidu.com/ai-doc/SPEECH/Vk38lxily

登录百度AI平台，建立创建应用：

URL=https://console.bce.baidu.com/ai/?fromai=1#/ai/speech/app/list

切记，接口选择：语音技术，建议全部勾选，一般默认是全部勾选的，按照页面的要求填写，即可

应用建立成功之后一定要记录以下几个参数的值，APP_ID

最低0.47元/天解锁文章

异想实验室

关注

2
点赞
踩
29

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。